1
กำหนดความสัมพันธ์ผ่านการแจกแจงเงื่อนไข
MATH003Lesson 10
00:00
ยินดีต้อนรับสู่การเปลี่ยนแปลงแนวคิดในสถิติ เราได้ก้าวข้ามแนวคิดพื้นฐานเกี่ยวกับ "เส้นแนวโน้ม" มาสู่กรอบที่เข้มงวดมากขึ้น กรอบการแจกแจง. ที่นี่ เราใช้ความสัมพันธ์ไม่เพียงแค่จากค่าสหสัมพันธ์ แต่เป็นการเปลี่ยนแปลงใด ๆ ในพฤติกรรมเชิงความน่าจะเป็นของตัวแปรตอบสนอง $Y$ เมื่อตัวแปรทำนาย $X$ เปลี่ยนแปลง

นิยาม 10.1.1: ความสัมพันธ์ทางสถิติ

ตัวแปรสองตัว $X$ และ $Y$ จะถือว่า มีความสัมพันธ์ หากมี การเปลี่ยนแปลงใด ๆ การเปลี่ยนแปลงในฟังก์ชันการแจกแจงเงื่อนไขของ $Y$ โดยที่ $X = x$ เมื่อ $x$ เปลี่ยนแปลง หากไม่มีความสัมพันธ์ ทางคณิตศาสตร์ก็เทียบเท่ากับความเป็นอิสระระหว่าง $X$ และ $Y$

ความเท่าเทียมเชิงตรรกะ

ตัวแปร $X$ และ $Y$ ไม่มีความสัมพันธ์ ก็ต่อเมื่อ $f(y|x) = f(y)$ สำหรับทุกค่าของ $x$ ซึ่งหมายความว่า ฟังก์ชันความถี่สัมพัทธ์ร่วมสามารถแยกตัวประกอบได้ว่า:

$$f(x, y) = f(x)f(y)$$

ดังนั้น การทดสอบความสัมพันธ์จึงเป็นการทดสอบอย่างแท้จริงของ ความเป็นอิสระ.

กลไกของการเปลี่ยนแปลง

ความสัมพันธ์จะถูกตรวจพบจากการเลื่อนตำแหน่งใด ๆ ของฟังก์ชันความหนาแน่นเงื่อนไข (ดูรูปที่ 10.1.1) ซึ่งรวมถึง:

  • การเปลี่ยนแปลงค่าเฉลี่ย: ค่าคาดหมาย $E(Y|X)$ เปลี่ยนแปลง (เป็นประเด็นหลักที่สุด)
  • การเปลี่ยนแปลงความแปรปรวน: ความกว้างหรือความไม่แน่นอนของ $Y$ ขึ้นอยู่กับ $X$ (ความแปรปรวนไม่สม่ำเสมอ)
  • การเปลี่ยนรูปแบบ: การแจกแจงโดยรวมเปลี่ยนแปลงรูปแบบ (ตัวอย่าง เช่น จากสมมาตรไปเป็นเบ้)

การสร้างความสัมพันธ์เชิงเหตุผลผ่านการออกแบบ

ความสัมพันธ์ทางสถิติไม่ได้หมายความว่าเป็นเหตุผล ในการอ้างว่า $X$ ก่อให้เกิด $Y$ เราต้องพิจารณาตัวแปรรบกวนผ่าน การออกแบบการทดลอง:

  • การควบคุมการบำบัด: ให้พื้นฐานเปรียบเทียบ
  • ผลของยาหลอก: ลดผลกระทบของการรับรู้ว่าดีขึ้นจากสารที่ไม่กระตุ้น
  • การปิดบัง: ใช้ การทดลองแบบปิดบัง (ผู้รับไม่ทราบ) และ การทดลองแบบสองชั้นปิดบัง (ผู้รับและนักวิจัยไม่ทราบ) เพื่อลดอคติ
  • การบล็อก: ตามที่เห็นใน ตัวอย่าง 10.1.7, เราใช้ตัวแปรบล็อก ($W$ เช่น ความอุดมสมบูรณ์ของดิน) เพื่อให้ความสัมพันธ์ระหว่างชนิดข้าวสาลี ($X$) และผลผลิต ($Y$) ไม่ถูกบิดเบือนจากเงื่อนไขเดิม
🎯 การประมาณค่าทางคณิตศาสตร์หลัก
เราประมาณความสัมพันธ์เหล่านี้โดยใช้ ความน่าจะเป็นเงื่อนไข ฟังก์ชัน สำหรับข้อมูลแบบไม่ต่อเนื่องที่มีค่าจำนวน $f_{ij}$:
$$L = \prod_{i=1}^a \prod_{j=1}^b (\theta_{j|X=i})^{f_{ij}}$$ ค่าเบี่ยงเบนมาตรฐาน: $SE = \sqrt{\frac{\hat{\theta}_{ij}(1 - \hat{\theta}_{ij})}{n}}$